Apprentissage de distance pour l’annotation d’images par plus proches voisins
نویسندگان
چکیده
Image annotation is an important open problem in computer vision. For this task we propose TagProp, a weighted nearest neighbor model, discriminatively trained to exploit labeled training images for predicting tags of test images. Neighbor weights are based on neighbor rank or distance. TagProp can learn the metric that defines neighbors by maximizing the log-likelihood of the tag predictions in the training set. Hence, we can optimally combine several image similarity metrics that cover different aspects of image content, from global color histograms to local shape descriptors. We also propose to specifically modulate each word to boost the recall of rare words. We compare the performance of the different variants of our model to existing work for three challenging data sets. On all measures, TagProp notably improves over the state-of-the-art.
منابع مشابه
Large Scale Metric Learning for Distance-Based Image Classification
This paper studies large-scale image classification, in a setting where new classes and training images could continuously be added at (near) zero cost. We cast this problem into one of learning a lowrank metric, which is shared across all classes and explore k-nearest neighbor (k-NN) and nearest class mean (NCM) classifiers. We also introduce an extension of the NCM classifier to allow for ric...
متن کاملIdentification de documents par classification monoclasse
RÉSUMÉ. Utilisée dans un contexte industriel, la classification d’images de documents nécessite le respect de certaines contraintes; par exemple, être confronté à une grande variabilité des documents et/ou du nombre de classes. Dans cet article, nous répondons à ce problème en présentant une nouvelle approche basée sur la spécialisation du vecteur de caractéristiques et d’un classificateur pour...
متن کاملUtilisation de relations ontologiques pour la comparaison d'images décrites par des annotations sémantiques
Résumé. Face à la complexité des nouvelles générations d’images médicales, les processus de recherche d’images basés sur leurs contenus visuels peuvent s’avérer insuffisants. Cet article propose une nouvelle approche basée sur l’annotation des images via des termes sémantiques pouvant pallier ce problème. Elle repose sur la combinaison d’une distance hiérarchique permettant de comparer les imag...
متن کاملDistributed approximate KNN Graph construction for high dimensional Data
La construction des graphes de plus proches voisins est un problème crucial pour nombre d’applications, notamment celles impliquant des algorithmes d’apprentissage et de fouille de données. Bien qu’il existe certain travaux visant à résoudre le problème dans des environnements centralisés, ils en restent néanmoins limités en raison du volume croissant des données ainsi que leur dimensionalité. ...
متن کاملExtraction bayésienne et intégration de patterns représentés suivant les K plus proches voisins pour le go 19x19
Résumé. Cet article décrit la génération automatique et l’utilisation d’une base de patterns pour le go 19x19. La représentation utilisée est celle des K plus proches voisins. Les patterns sont engendrés en parcourant des parties de professionnels. Les probabilités d’appariement et de jeu des patterns sont également estimées à ce moment là. La base créée est intégrée dans un programme existant,...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2011